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<! — StartFragment — > RESULT 4 
ATH243015 

LOCUS ATH243015 5000 bp DMA linear PLN 01-JUN-2001 

DEFINITION Arabidopsis thaliana LGT1 gene, and partial FUSCA6 gene. 
ACCESSION AJ243015 
VERSION AJ243015.1 GI:7799776 

KEYWORDS FUSCA6 gene; FUSCA6 protein; LGT1 gene; like glycosyl transferase 
1 . 

SOURCE Arabidopsis thaliana (thale cress) 

ORGANISM Arabidopsis thaliana 

Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; 

Spermatophyta; Magnoliophyta; eudicotyledons ; core eudicotyledons ; 

rosids; eurosids II; Brassicales; Br assicaceae ; Arabidopsis. 
REFERENCE 1 

AUTHORS Tavares,R., Aubourg,S., Lecharny,A. and Kreis,M. 

TITLE Organization and structural evolution of four multigene families in 

Arabidopsis thaliana: AtLCAD, AtLGT, AtMYST and AtHD-GL2 
JOURNAL Plant Mol . Biol. 42 (5), 703-717 (2000) 
PUBMED 10809443 
REFERENCE 2 (bases 1 to 5000) 
AUTHORS Tavares,R. 
TITLE Direct Submission 

JOURNAL Submitted ( 07-MAY-1999 ) R. Tavares, Institut de Biotechnologie des 
Plantes, Biologie du Developpement des Plantes, Universite 
Paris-Sud, Batiment 630, F-91405 Orsay Cedex, FRANCE 
FEATURES Location/Qualifiers 
source 1. .5000 

/ or ganism=" Arabidopsis thaliana" 
/mol_type="genomic DNA" 
/db_xref="taxon:3702" 
/map="22400 Kb" 
/ecotype= "Columbia" 
gene 630. .3744 

/gene="LGTl" 

CDS join(630. .780,1108. .1133,1233. .1292,1383. .1508,1598. .1661, 

1739. .1785,1900. .2234,2328. .2686,2797. .3374,3469. .3744) 
/gene="LGTl" 
/codon_start=l 

/product="like glycosyl transferase 1" 
/protein_id="CAB91508. 1" 
/db_xref="GI : 7799777" 
/db_xref="GOA:Q9LE59" 
/db_xref="UniProtKB/TrEMBL:Q9LE59" 

/translat ion="MALKRGLSGVNRIRGSGGGSRSVLVLLIFFCVFAPLCFFVGRGV 
YIDSSNDYS IVSVKQNLDWRERLAMQSVRSLFSKE ILDVIATSTADLGPLSLDSFKKN 
NLSASWRGTGVDPSFRHSENPATPDVKSNNLNEKRDSI SKDSIHQKVETPTKIHRRQL 
REKRREMRANELVQHNDDTILKLENAAIERSKSVDSAVLGKYS IWRRENENDNSDSNI 
RLMRDQVIMARVYSGIAKLKNKNDLLQELQARLKDSQRVLGEATSDADLPRSAHEKLR 
AMGQVLAKAKMQLYDCKLVTGKLRAMLQTADEQVRSLKKQSTFLAQLAAKTIPNPIHC 
LSMRLTIDYYLLSPEKRKFPRSENLENPNLYHYALFSDNVLAASWVNSTIMNAKDPS 
KHVFHLVTDKLNFGAMNMWFLLNPPGKATIHVENVDEFKWLNSSYCPVLRQLESAAMR 
EYYFKADHPTSGSSNLKYRNPKYLSMLNHLRFYLPEVYPKLNKILFLDDDI IVQKDLT 
PLWEVNLNGKVNGAVETCGESFHRFDKYLNFSNPHIARNFNPNACGWAYGMNMFDLKE 
WKKRDITGIYHKWQNMNENRTLWKLGTLPPGLITFYGLTHPLNKAWHVLGLGYNPSID 
KKDIENAAWHYNGNMKPWLELAMSKYRPYWTKYIKFDHPYLRRCNLHE" 

exon 630. .780 

/gene="LGTl" 
/number=l 

intron 781. .1107 

/gene="LGTl" 
/ number =1 
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1108. .1133 
/gene="LGTl" 

/experiment=" experimental evidence, no additional details 

recorded" 

/number=2 

1134. .1232 

/gene="LGTl" 

/ number=2 

1233. .1292 

/gene="LGTl" 

/experiment="experimental evidence, no additional details 

recorded" 

/number=3 

1293. .1382 

/gene="LGTl" 

/number=3 

1383. .1508 

/gene="LGTl" 

/experiment=" experimental evidence, no additional details 

recorded" 

/number =4 

1509. .1597 

/gene="LGTl" 

/number =4 

1598. .1661 

/gene="LGTl" 

/experiment=" experimental evidence, no additional details 

recorded" 

/number =5 

1662. .1738 

/gene="LGTl" 

/number=5 

1739. .1785 

/gene="LGTl" 

/experiment="experimental evidence, no additional details 

recorded" 

/number=6 

1786. .1899 

/gene="LGTl" 

/number=6 

1900. .2234 

/gene="LGTl" 

/number=7 

2235. .2327 

/gene="LGTl" 

/number=7 

2328. .2686 

/gene="LGTl" 

/number=8 

2687. .2796 

/gene="LGTl" 

/number=8 

2797. .3374 

/gene="LGTl" 

/number=9 

3375. .3468 

/gene="LGTl" 

/number=9 

3469. .3744 

/gene="LGTl" 

/number=10 



)://es/ScoreAccessWeb/GetItem.action?AppId=10544180cS:seqId=09323b678028c74f&It... 6/9/2008 



SCORE Search Results Details for Application 10544180 and Search Result 20070806_1... Page 3 of 6 



gene 
exon 



4524. .5000 

/gene="FUSCA6 " 

4524. .4954 

/gene="FUSCA6 " 

/number=l 

4565. .>4954 

/gene="FUSCA6 " 

/codon_start=l 

/product="FUSCA6 protein" 

/protein_id="CAB9 1509.1" 

/db_xref="GI : 7799778" 

/db_xref="UniProtKB/TrEMBL:Q9M4G0" 

/ translat ion="MERDEEASGPMMEMCTNGGEETSNRRPI I SGEPLDIEAYAALYK 

GRTKIMRLLFIANHCGGNHALQFDALRMAYDEIKKGENTQLFREWNKIGNRLGEKYG 

MD L AWC E AVDRRAEQKKVKLENE L S S Y R " 

4955. .>5000 

/gene="FUSCA6 " 

/ number =1 



Alignment Scores: 
Pred. No . : 
Score : 

Percent Similarity: 
Best Local Similarity: 
Query Match: 
DB: 



3214.50 
64.5% 
64.5% 
90.5% 



Length: 
Matches : 
Conservative : 
Mismatches : 
Indels : 
Gaps : 



5000 
670 



US-10-544-180A-2 (1-673) x ATH243015 (1-5000) 

Qy 1 MetAlaLeuLysArgGlyLeuSerGlyValAsnArglleArgGlySerGlyGlyGlySer 20 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 630 ATGGCGCTAAAGCGAGGGCTATCTGGAGTTAACCGGATTAGAGGAAGTGGTGGTGGATCT 689 

Qy 21 ArgSerValLeuValLeuLeuIlePhePheCysValPheAlaProLeuCysPhePheVal 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 690 CGATCTGTGCTTGTGCTTCTCATATTTTTCTGTGTTTTTGCACCTCTTTGCTTCTTTGTT 749 



41 GlyArgGlyValTyrlleAspSerSerAsn 50 

750 GGCCGAGGAGTGTATATCGATTCCTCAAATGGTATGCATATATTGCTTATCTTTCTATAT 809 

50 50 

810 ACTAATTTGCAGATTCATGTATAGAGATTCAGAAATTCTATTAATGATTGAGAACATTAG 86 9 

50 50 

8 70 CATAGTTTTACCACTCTTTAGTTTTCAGCCTTTACTATCTCAATTTTAAGTTACTTTTAG 929 

50 50 

930 CTTGATGTGACACTGATGATATTCAGACAATTGCTATTTTTCTAGACTGGCAAAATTGGT 989 

50 50 

990 TCTTTGC TAT TT TACT ATCGAGCTTTGGTTTCAAGGAT TAGTGTCTCTCGATTTTGTGTT 1049 

51 Asp 51 

I I I 

1050 ACATATATAATTTATCTGCGAATTGTCCATCTGATGGAGCTTACTTTCATTACTGCAGAT 1109 
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52 TyrSerlleValSerValLys 58 

I I I I I I I I I I I I I I I I I I I I I 
1110 TATTCAATTGTTTCTGTGAAGCAGGTATGTCGGCTTAAACTCTATCAAATTATCTACTTG 116 9 



1170 TATGTTTTGACAGAAGTAAGAATGTTGTTTGATTGGACTGTTTTTTTTTGTTTTTTTTGG 122 9 

59 GlnAsnLeuAspTrpArgGluArgLeuAlaMetGlnSerValArgSerLeuPheSerLys 78 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1230 CAGAATCTTGACTGGAGAGAACGTTTAGCAATGCAATCTGTTAGATCTCTTTTCTCGAAA 128 9 

79 Glu 79 

I I I 

1290 GAGGTAGTTTAAATCTTTGAAACTTTGCTTCGATTTATTGTCTTTGTCAGTTTTTCTGAG 13 4 9 

80 IleLeuAspVallleAlaThrSerThr 88 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1350 ACTGGATAGTTTCTTACTAAATTTGTTGTCCAGATACTAGATGTTATAGCAACCAGCACA 140 9 

89 AlaAspLeuGlyProLeuSerLeuAspSerPheLysLysAsnAsnLeuSerAlaSerTrp 108 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1410 GCTGATTTGGGTCCTCTTAGCCTTGATTCTTTTAAGAAAAACAATTTGTCTGCATCATGG 146 9 

109 ArgGlyThrGlyValAspProSerPheArgHisSerGlu 121 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 70 CGGGGAACCGGAGTAGACCCCTCCTTTAGACATTCTGA-GGTGTGGTTTAAGTGTCTCAT 15 28 



1529 TTCTTTTCTAAGCTTCTATTCTCAATGATGTTTTCTCATAGTTTTCATCTTTTGCTGTAC 1588 

122 AsnProAlaThrProAspValLysSerAsnAsnLeuAsnGluLysArgAsp 138 

I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1589 TTGAGGCAGAATCCAGCAACTCCTGATGTCAAATCTAATAACCTGAATGAAAAACGTGAC 16 48 

139 SerlleSerLys 142 

I I I I I I III 

16 49 AGCATTTC-AAAAGGTAGTGGCTTTTAATTTAAGTGGCATCTCTGATTTGACGTTTTCCA 170 7 

143 AspSerlleHisGlnLysValGluThrPro 152 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1708 TCTCTGATTCTTCTATATATTGCTGATGCAGATAGTATCCATCAGAAAGTTGAGACACCT 176 7 

153 ThrLysIleHisArgArg 158 

I I I I I I I I I I I I I I I I I I 

176 8 ACAAAGATTCACAGAAGGGTAACTATTATTTATTAAAGTTCAATGTCATGATGCATCAAA 182 7 



1828 TACTCTTTAGGGACTTCTTGTGTCTTTAGTATTTCATTATCAACATTTTTTTTATCCATC 188 7 

159 GlnLeuArgGluLysArgArgGluMetArgAlaAsnGluLeuValGln 174 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1888 TTGACATTTCAGCAAC TAAGAGAGAAAAGGCGTGAGATGCGGGCAAATGAGTTAGTTCAG 194 7 

175 HisAsnAspAspThrlleLeuLysLeuGluAsnAlaAlalleGluArgSerLysSerVal 194 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1948 CACAATGATGACACGATTTTGAAACTCGAAAATGCTGCCATTGAACGCTCTAAGTCTGTT 2007 
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195 AspSerAlaValLeuGlyLysTyrSerlleTrpArgArgGluAsnGluAsnAspAsnSer 214 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2008 GATTCTGCAGTCCTTGG T AAAT AC AG T AT T T GG AG AAG AG AAAAT G AG AA T G AC AAC T C T 206 7 

215 AspSerAsnlleArgLeuMetArgAspGlnVallleMetAlaArgValTyrSerGlylle 23 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
206 8 GATTCAAATATACGCTTGATGCGGGATCAAGTAATAATGGCTAGAGTCTATAGTGGGATT 212 7 

235 AlaLysLeuLysAsnLysAsnAspLeuLeuGlnGluLeuGlnAlaArgLeuLysAspSer 25 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2128 GCAAAATTGAAAAACAAGAACGATTTGTTACAAGAACTCCAGGCCCGACTTAAGGACAGC 2187 

255 GlnArgValLeuGlyGluAlaThrSerAspAlaAspLeuProArg 269 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2188 CAACGGGTTTTGGGGGAAGCAACATCTGATGCTGATCTTCCTCGGAGGTAAATTACTCCT 22 4 7 



22 48 TTTGGTTTCTAC TACT TGCCTTTTTTCGACTGCTTGTGTACTTCTT AAAT AACATGCTCT 230 7 

270 SerAlaHisGluLysLeuArgAlaMetGlyGlnValLeuAla 283 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2308 CTAAATTACTTTTCATATAGTGCGCATGAGAAACTCAGAGCCATGGGTCAAGTCTTGGCT 236 7 

28 4 LysAlaLysMetGlnLeuTyrAspCysLysLeuValThrGlyLysLeuArgAlaMetLeu 303 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
236 8 AAAGCTAAGATGCAGTTATATGACTGCAAGCTGGTTACTGGAAAGCTGAGAGCAATGCTT 2 42 7 

304 GlnThrAlaAspGluGlnValArgSerLeuLysLysGlnSerThrPheLeuAlaGlnLeu 323 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 428 CAGACTGCCGACGAACAAGTGAGGAGCTTAAAGAAGCAGAGTACTTTTCTGGCTCAGTTA 2 48 7 

32 4 AlaAlaLysThrlleProAsnProIleHisCysLeuSerMetArgLeuThrlleAspTyr 343 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 488 GCAGCAAAAACCATTCCAAATCCTATCCATTGCCTATCAATGCGCTTGACTATCGATTAC 25 4 7 

344 TyrLeuLeuSerProGluLysArgLysPheProArgSerGluAsnLeuGluAsnProAsn 363 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I 
2548 TATCTTCTGTCTCCGGAGAAAAGAAAATTCCCTCGGAGTGAAAACCTAGAAAACCCTAAT 2607 

36 4 LeuTyrHisTyrAlaLeuPheSerAspAsnValLeuAlaAlaSerValValValAsnSer 383 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2608 CTTTATCATTATGCCCTCTTTTCCGACAATGTAT TAGCTGCATCAGTAGTTGTTAACTCA 266 7 

384 ThrlleMetAsnAlaLys 389 

I I I I I I I I I I I I I I I 

26 6 8 ACCATCATGAATGCCAA-GGTAAAATCATTAGCTCTTATCACTTGATTCGTCCTAATATC 2 72 6 



2 72 7 TGTATGTTTAATTTTAGATACGCATTGCAGAGCTGAAATTAAAAATGTCTTTATTCCCTA 2 78 6 

390 AspProSerLysHisValPheHisLeuValThrAspLysLeuAsnPheGly 406 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 78 7 TATGTGCAGGATCCTTCTAAGCATGTTTTTCACCTTGTCACGGATAAACTCAATTTCGGA 28 4 6 

40 7 AlaMetAsnMetTrpPheLeuLeuAsnProProGlyLysAlaThrlleHisValGluAsn 426 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2847 GCAATGAACATGTGGTTCCTCCTAAACCCACCCGGAAAGGCAACCATACATGTGGAAAAC 2906 

42 7 ValAspGluPheLysTrpLeuAsnSerSerTyrCysProValLeuArgGlnLeuGluSer 4 46 
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Db 2907 GTCGATGAGTTTAAGTGGCTCAATTCATCTTACTGTCCTGTCCTTCGTCAGCTTGAATCT 2966 

Qy 447 AlaAlaMetArgGluTyrTyrPheLysAlaAspHisProThrSerGlySerSerAsnLeu 466 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2967 GCAGCAATGAGAGAGTACTATTTTAAAGCAGACCATCCAACTTCAGGCTCTTCGAATCTA 3026 

Qy 467 LysTyrArgAsnProLysTyrLeuSerMetLeuAsnHisLeuArgPheTyrLeuProGlu 486 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3027 AAATACAGAAACCCAAAGTATCTATCCATGTTGAATCACTTGAGATTCTACCTCCCTGAG 3086 

Qy 487 ValTyrProLysLeuAsnLysIleLeuPheLeuAspAspAspIlelleValGlnLysAsp 506 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3087 GTTTATCCCAAGCTGAACAAAATCCTCTTCCTGGACGATGACATCATTGTTCAGAAAGAC 3146 

Qy 507 LeuThrProLeuTrpGluValAsnLeuAsnGlyLysValAsnGlyAlaValGluThrCys 526 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3147 TTGACTCCACTCTGGGAAGTTAACCTGAACGGCAAAGTCAACGGTGCAGTCGAAACCTGT 3206 

Qy 527 GlyGluSerPheHisArgPheAspLysTyrLeuAsnPheSerAsnProHisIleAlaArg 546 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3207 GGGGAAAGTTTCCACAGATTCGACAAGTATCTCAACTTTTCGAATCCTCACATTGCGAGG 3266 



547 AsnPheAsnProAsnAlaCysGlyTrpAlaTyrGlyMetAsnMetPheAspLeuLysGlu 56 6 
I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I 
326 7 AACTTCAATCCAAATGCTTGTGGATGGGCTTATGGAATGAACATGTTCGACCTAAAGGAA 332 6 

567 TrpLysLysArgAspIleThrGlylleTyrHisLysTrpGlnAsnMet 582 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3327 TGGAAGAAGAGAGACATCACTGGTATATACCACAAGTGGCAAAACATGGTAAATAACTCT 3386 



3387 TTAATTCTTTGCAACAAATAGTCTAATGATGGTTTATTATTTTATTTATTGTGGTTTGCT 3446 

583 AsnGluAsnArgThrLeuTrpLysLeuGlyThrLeuPr 595 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3 4 4 7 CATTTTGGCTTGTGTTGTTTAGAATGAGAACAGGACACTATGGAAGCTAGGGACATTGCC 350 6 

595 oProGlyLeuIleThrPheTyrGlyLeuThrHisProLeuAsnLysAlaTrpHisValLe 615 
I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
350 7 ACCAGGATTAATAACATTCTACGGATTAACACATCCCTTAAACAAGGCGTGGCATGTGCT 356 6 

615 uGlyLeuGlyTyrAsnProSerlleAspLysLysAspIleGluAsnAlaAlaValValHi 635 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
356 7 GGGACTTGGATATAACCCGAGTATCGACAAGAAGGACATTGAGAATGCAGCAGTGGTTCA 36 2 6 

635 sTyrAsnGlyAsnMetLysProTrpLeuGluLeuAlaMetSerLysTyrArgProTyrTr 6 55 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
36 2 7 CTATAACGGGAACATGAAACCATGGTTGGAGTTGGCAATGTCCAAATATCGGCCGTATTG 36 8 6 

655 pThrLysTyrlleLysPheAspHisProTyrLeuArgArgCysAsnLeuHisGlu 673 

36 8 7 GACCAAGTACATCAAGTTTGATCACCCATATCTTCGTCGTTGCAACCTTCATGAA 3741 



< ! — EndFragment — > 
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